hhkb
AI

인공지능기초_05_딥러닝과 머신러닝 비교

작성자 : Heehyeon Yoo|2025-12-01
# AI# DeepLearning# MachineLearning# FeatureEngineering# Optimization

1. 개요

모든 문제에 딥러닝(Deep Learning)을 사용하는 것이 정답은 아니다. 문제의 복잡도(Complexity)와 데이터의 특성(Feature)에 따라 전통적인 머신러닝(Traditional Machine Learning)이 더 효율적일 수 있다.

2. 특징 추출(Feature Engineering)의 차이

2.1. 머신러닝의 접근 방식

  • 피처 엔지니어링 수행: 연구자나 개발자가 데이터의 주요 특징(Feature)을 직접 정의하고 추출해야 한다.
  • 스팸 문자 예시:
    • "국제발신", "웹발신" 등의 키워드 유무.
    • "수익 보장", "급등주" 등 특정 단어의 빈도.
    • 본문 길이, 특수문자 개수 등 수작업으로 규칙을 정의.
  • 한계점: 사람이 사전에 정의하지 않은 패턴(예: "손실 만회"와 같은 새로운 뉘앙스)은 탐지하기 어렵다. 즉, 도메인 지식(Domain Knowledge)에 크게 의존한다.

2.2. 딥러닝의 접근 방식

  • End-to-End 학습: 데이터(Raw Data)와 정답(Label)만 입력하면, 모델이 스스로 데이터 내부의 특징을 추출하고 학습한다. 별도의 피처 엔지니어링 과정이 없다.
  • 장점: 사람이 인지하기 힘든 미세한 패턴이나 비선형적인 관계까지 파악할 수 있어, 확장성과 정확도가 높다.
  • 단점: 머신러닝 대비 훨씬 더 많은 데이터(Massive Dataset)와 연산 자원(GPU)이 필요하다.

3. 기술 선택 전략: 언제 딥러닝을 써야 하는가?

3.1. 머신러닝이 적합한 경우

데이터가 정형화(Structured)되어 있고 규칙이 명확한 경우, 머신러닝이 비용 효율적이다.

  • 사례: 자동차 번호판 인식(LPR)
    • 번호판의 규격(7자리 -> 8자리)은 국가 표준으로 정해져 있으며, 변경 주기가 매우 길다(10~20년).
    • 카메라의 각도와 번호판 위치가 고정적이다.
    • 이러한 경우, 간단한 OCR(Optical Character Recognition)이나 머신러닝 모델로도 충분히 높은 정확도를 낼 수 있으며, 규격 변경 시 빠르게 재학습하여 대응 가능하다.

3.2. 딥러닝이 적합한 경우

데이터가 비정형(Unstructured)이고 패턴이 복잡하며 변동성이 잦은 경우, 딥러닝이 필수적이다.

  • 사례: 챗봇(Chatbot) 및 자연어 처리(NLP)
    • 인간의 언어는 문맥(Context), 줄임말, 신조어, 오타 등 변수가 무한에 가깝다.
    • 사람이 일일이 규칙(Rule)을 정의할 수 없다(피처 엔지니어링의 한계).
    • 딥러닝은 방대한 텍스트 데이터를 통해 언어의 내재적 패턴을 학습하므로, 복잡한 언어 처리에 적합하다.

4. 결론

딥러닝은 강력하지만 만능 도구(Silver Bullet)는 아니다. 데이터 수집/가공 비용(Cost), 필요한 하드웨어 리소스, 문제의 난이도를 종합적으로 고려하여 적절한 모델을 선택해야 한다.